其他
小白学爬虫-进阶-PySpider操作指北
2020,努力做一个无可替代的人!
作者|小一
全文共1455字,阅读全文需6分钟
写在前面的话
在PySpider 的使用过程中,还是会遇到大大小小的问题。
所以今天的内容可能截图会多一些,差不多是按照踩坑流程一步步走下来的
如果你在在使用过程中遇到不一样的问题,也欢迎一起讨论交流。
关于PySpider 的相关概念,大家看上篇文章就行了,这节主要是配置使用
正文
首先,是安装
这个应该大家都不陌生了,毕竟从前面的BeautifulSoup、Numpy、Pandas等都是通过同样的方式安装的
打开cmd 窗口,输入以下命令:
pip install pyspider
如果超时的话建议连手机热点,几MB流量,很快就下好了
安装成功之后,会出现这个界面
接下来,是启动PySpider
注意,这块的问题比较多
正常情况下,我们在cmd 中可以直接启动PySpider
pyspider all
正常启动的界面应该是这样的:
但是,事与愿违,大多数情况下你是无法正常启动的
首先,你会遇到这个问题:
async 从 python3.7 开始已经加入保留关键字中. 所以async 不能作为函数的参数名
run.py
fetcher\tornado_fetcher.py
webui\app.py
打开之后将里面的async 改成其他非Python 关键字
需要注意的是,在部分Python 文件中会需要改动好几处这种情况
'HTTPAuthenticator':NeedAuthController(app),
},
pyspider all
创建PySpider
使用PySpider
如果这一步点击run 报错或者无效之后,你可以保存页面后刷新浏览器再试
切换到html 选项卡可以看到是整个页面的所有元素,切换到web 选项卡是整个页面的网页显示
总结一下:
写在后面的话
好巧啊,你也读到这了!
点个
在看
让小一看到你